通过将搜索任务框架作为解释跨度检测来绘制语义搜索问题,即给定文本作为查询短语的段,任务是在给定文档中识别其释放,与通常相同的建模设置用于提取问题的回答。在Turku释放语料库中的100,000手动提取芬兰语释义对,包括其原始文档上下文,我们发现我们的扫描跨度检测模型分别优于31.9pp和22.4pp的两个强烈的检索基线(词汇相似性和BERT句子嵌入)。匹配,达到22.3pp和12.9pp的令牌级F分数。这展示了在跨度检索而不是句子相似性方面建模任务的强大优点。此外,我们介绍了一种通过背部翻译创建人工释义数据的方法,适用于手动注释用于训练的跨度检测模型的剖析资源。
translated by 谷歌翻译
高斯流程是许多灵活的统计和机器学习模型的关键组成部分。但是,由于需要倒转和存储完整的协方差矩阵,它们表现出立方计算的复杂性和高内存约束。为了解决这个问题,已经考虑了高斯流程专家的混合物,其中数据点被分配给独立专家,从而通过允许基于较小的局部协方差矩阵来降低复杂性。此外,高斯流程专家的混合物大大富含模型的灵活性,从而允许诸如非平稳性,异方差和不连续性等行为。在这项工作中,我们基于嵌套的蒙特卡洛采样器构建了一种新颖的推理方法,以同时推断门控网络和高斯工艺专家参数。与重要性采样相比,这大大改善了推断,尤其是在固定高斯流程不合适的情况下,同时仍然完全平行。
translated by 谷歌翻译
角色扮演游戏(RPG)在视频游戏对话中具有相当多的文本。游戏开发人员经常将此文本半通知。在本文中,我们从几个RPG中提取了有说服力对话的多语言数据集。我们使用称为BERT的自然语言处理(NLP)模型来显示该数据在构建说服检测系统中的生存能力。我们认为,作为各种NLP任务的数据源,视频游戏具有许多未使用的潜力。本文中描述的代码和数据可在Zenodo上找到。
translated by 谷歌翻译
各种图形渲染和处理操作需要深度图。当在分布式系统中执行此类操作时,经常需要深度图流量流,并且在大多数情况下需要快速执行压缩,这就是为什么经常使用视频编解码器的原因。标准视频编解码器的硬件实现甚至可以在资源约束的设备上实现相对较高的分辨率和帧率组合,但是不幸的是,这些实现当前不支持RGB+深度扩展。但是,它们可以通过将深度图填充到RGB或YUV框架中来用于深度压缩。我们使用深度图包装的组合研究深度图压缩,然后使用标准视频编解码器进行编码。我们表明,深度图被包装的精度对由包装方案的组合和限制性压缩造成的误差产生了巨大而无处不在的影响。因此,我们提出了一个由神经网络模型辅助的可变精度包装方案,该模型可以预测给定比特率约束的每个深度图的最佳精度。我们证明该模型的产生几乎最佳的预测,并且可以将其集成到具有现代硬件的高架开销的游戏引擎中。
translated by 谷歌翻译